Evaluación del clustering de páginas web mediante funciones de peso y combinación heurística de criterios

نویسندگان

  • Raquel Martínez-Unanue
  • Víctor Fresno-Fernández
  • Arantza Casillas
  • Soto Montalvo
چکیده

Web page clustering can help in the evaluation and search of the results of search engines, among other things. The different term weighting functions applied to the selected features to represent web pages is a main aspect in clustering task. In this paper, seven different term weighting functions are evaluated by means of the results of a partitioning clustering algorithm, with a reference web page collection. In addition, two feature reduction methods are applied. Five of them are well-known term weighting functions from text content analysis; the other two are based on a heuristic criteria combination, which consider HTML mark-up information. These two representations have been proposed in previous works by one of the authors. We have verified that the best results are obtained when the term weighting function based on a fuzzy criteria combination is used.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Usabilidad en el Desarrollo Web Dirigido por Modelos: Resultados de un Experimento Controlado

Las aplicaciones Web deben ser usables para ser aceptadas por los usuarios y garantizar su éxito. Este hecho ha motivado la aparición de una gran variedad de métodos de evaluación de usabilidad Web, sin embargo, existe una carencia de métodos validados empíricamente que puedan integrarse adecuadamente en fases tempranas del proceso de desarrollo Web. Motivados por este hecho se propuso un proce...

متن کامل

Predicción de Múltiples Puntos de Series de Tiempo Utilizando Support Vector Machines

Se presenta la evaluación de la predicción de múltiples puntos de series de tiempo, mediante un corrimiento de ventana para Support Vector Machines (SVM) con dos funciones de kernel distintas (lineal y con base radial). Para la evaluación se utilizó un conjunto de treinta series de diferente origen y comportamiento dinámico. Se encuentra que la SVM posee una buena capacidad para ajustarse a las...

متن کامل

Transformación de Modelos Navegacionales Dirigida por Criterios de Calidad

Resumen. La Ingenieŕıa Web ha reconocido desde sus inicios el papel preponderante que la navegabilidad juega en el diseño de aplicaciones Web, motivo por el cual se han propuesto distintas medidas para evaluarla. De entre ellas, las medidas definidas sobre modelos conceptuales son especialmente relevantes, ya que es bien sabido que la mejora de los artefactos producidos durante el proceso de de...

متن کامل

[Evaluation of research activity by nursing teaching staff].

El Real Decreto 1086/1989 de 28 de agosto, introdujo en el régimen retributivo del profesorado universitario un nuevo concepto destinado a incentivar la actividad investigadora mediante evaluaciones anuales que quedaban encargadas a una comisión evaluadora, la Comisión Nacional De Evaluación De La Actividad Investigadora (CNEAI). La evaluación de la actividad cientı́fica es un proceso reglado en...

متن کامل

Diseño de Circuitos Lógicos en base a la tecnología FPGA: Un ejemplo de aplicación (Compendio)

Si bien el dispositivo seleccionado es del tipo de Arreglo de Celdas Lógicas (Logic Cell Array, LCA), los criterios de diseño y las herramientas de programación aplicadas son, en lo general, similares a los correspondientes a otras familias de dispositivos FPGA. La razón de esta selección es que los LCA tienen una gran aceptación como alternativa práctica de los tradicionales PLDs, y en algunos...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:
  • Procesamiento del Lenguaje Natural

دوره 35  شماره 

صفحات  -

تاریخ انتشار 2005